技術問答
技術文章
iT 徵才
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
23
0
AI & Data
嘗試在AI世界闖蕩
系列 第
23
篇
Day 23 AI核心應用:自然語言處理(AM、Transformer)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-08 18:51:03
896 瀏覽
分享至
注意力機制Attention Mechanism,簡稱AM**
是目前深度學習中非常重要的一個機制。
是個提升系統專注力的功能機制,可以架接在任何深度學習的模式上。
透過另一層網路參數來學習每個字與其上下文之間的權重加成。
直接聚焦在與他相關的輸入數據上來記憶與處理,對於不相關沒有影響力的其他訊息,則給予低權值(類似尋找資料的直接索引法)
例子: Emma chase Annie做英翻中時,Chase這個字應該聚焦在中文的追字,經過數萬次訓練後,機器已經學習好詞語詞對應關係,所以當下次要翻譯類似句子時,機器讀到Chase後,就能馬上升成一個Input與Output相關性的對照表。
特色、優點:
①聚焦,再生成輸出時,只聚焦與當前要輸出的字有相關性最大的個別輸入訊息。
②豐富性,對每個個別的輸入,都會提供一個背景向量Context Vector,提供了相對豐富的訊息。
③重要性,依賴每個詞不同的相關性、重要性,直接來對特徵值。
④正確率高,幫助ED Model正確掌握輸出與輸入的精確點對點對應關係,因此提升了NLP許多任務的精確性,特別是在超大文本的資料集上。
主要應用:
Transformer
基於EDmodel,加上自我注意力機制Self-Attention(SATT)的一種深度學習模式。
常被用於一種預訓練模式Pre-trained Model。
完全放棄了傳統RNN家族的架構,利用自我注意力機制SATT來取代相對複雜、序列性、速度慢、計算耗時的RNN架構。
逐漸成為NLP的主流模式,跨時代的典範轉移,產生跨時代的強大語言模型BERT。
架構圖:
應用:①機器翻譯:不同語言輸入詞與詞的對映關係 ②文本摘要:長文本與摘要間對映關係 ③QA系統:Q與A對映關係 ④語音辨識:語音訊息與文字的對應關係 ⑤Chatbot ⑥情緒分析:不同詞與情緒表示的對映關係
優點(與RNN比較):①平行處理 ②訊息豐富 ③個數少、複雜性低 ④重要性
自我注意力機制Self-Attention,簡稱SATT
利用源端的注意力機制Source Attention、目標端的注意力機制Target Attention與源端目標端交叉注意力機制Cross Attention三種ATT來擷取與輸出豐富的語意資訊,並在生成輸出時快速正確長我辭語詞之間應該聚焦對齊的各種關鍵訊息。
源端的注意力機制Source Attention:在輸入端能計算自己內部詞與詞之間的Attention來捕捉輸入內部訊息之間的依賴關係;對於句中每個字都平行獨立的去測量,依據輸入句子中其他字的關聯性大小,而賦予不同權重的一種注意力機制。
目標端的注意力機制Target Attention:輸出的目標端計算自己的Attention並捕捉輸出內部個個詞與詞的關係與重要性。
源端目標端交叉注意力機制Cross Attention:就是原本傳統Encoder與Decoder訊息的ATT,捕捉的是輸入序列的每個詞與輸出序列的每個詞之間的對應性與依賴關係。
因此相較於傳統機制,自我注意力機制多了兩個注意力。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 22 AI核心應用:自然語言處理(句向量、NLP)
下一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19855
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
防火牆fortinet只開放line 問題
Gem如何找到該功能?!我是Gemini付費使用者
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
熱門回答
防火牆fortinet只開放line 問題
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
熱門文章
ISC2 CC 證照考試筆記和影片
Cisco 300-415 ENSDWI 認證考試介紹(CCNP Enterprise 專項)
Agentic AI 開發實戰:我是如何設計 “Code + LLM” 混合架構,解決 AI品質不穩的問題?
VScode 開發應用系統專案(10) - Spring boot MVC 應用系統設計(1)
【資料治理實戰回憶錄】04. 拆解元數據 (下):讓資料「用起來」
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}